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Titel: Verfahxen zum Debuggen rekonfiguxierbarer 

Architekturen 

5 Beschrelbung 

Die vorliegende Erfindxing befafit sich mlt Verfahren fOr das 
Debuggen von Programmen auf konfigurierbaren Architekturen. 
Onter einer rekonfigiaxlerbaren Architektur werden u. a. Bau* 

10 stelne (VPO) mit konflgurierbarer Funktion und/oder Veimet- 
zung verstanden, insbesondere Integrierte Bausteine inlt einer 
Mehrzahl von eln- oder mehrdimensional angeordneten arlthme- 
tiscben und/oder logischen und/oder analogen und/oder spel- 
chernden und/oder vemetzenden Baugruppen (im Folgenden PAEs 

15 genannt) und/oder koimaunlkatlven/peripheren Baugriq>pen (I0>, 
die direkt oder durch eln Oder mehrere Bus8ystem(e) miteinan- 
der verbunden slnd. PAEs sind in beliebiger Ausgestaltung/ 
Hischung und Hierarchie angeordnet. Dieae Anordnung wird im 
weiteren PAE-Array oder PA genannt* 

20 

Zur 6attung dieser Bausteine ziUilen systolische Arrays » neu- 
ronale Netze, Mehrprozessor-Systeme, Prozessoren mlt mehreren 
Rechenwerken und/oder logischen Zellen, Vemetzungs- und 
Hetzwerkbausteine wie z,B, Crossbar-Schalter, ebenso wie be- 

25 kannte Bausteine der Gattung FPGA, DPGA, XPUTBR, etc. Hinge- 
wiesen wird insbesondere in diesem Zusazomenhang auf die fol- 
genden Schutzrechte desselben Anmelders: P 44 16 881.0-53, DE 
197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DB 196 54 593.5-53, DE 197 04 044,6-53, DE 198 80 129.7, 

30 DE 198 61 088.2-53, DB 199 80 312.9, PCT/DB 00/01869, 
DE 100 36 627.9-33, DB 100 28 397.7, DE 101 10 530.4, 
DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, 
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DB 102 06 856.9, 60/317,876, DE 102 02 044.2, DE 101 29 
237.6-53, DE 101 39 170.6. Diese sind hiermit zu Offenba- 
rungszwecken vollumfSnglich eingegliedert. 

5 Weiterhixi soil angemerlct werden, dafi die zu beschrelbenden 
Verfahxen auch auf Gruppen von mehreren Bausteinen angewendet 
werden kOnnen. Dennoch wlrd nachfolgend auf VPO und/oder auf 
,/Bausteine^ Bezug genommen. Diese Bauteile und deren Betrleb 
slnd noch zu verbessem. 

10 

Die Aufgabe der vorllegenden Erfindung besteht darin, Neues 
fQr die gewerbliche Anwendung bereitzustellen. 

Die LOsung der Aufgabe wlrd unabhSngig beansprucht. Bevorzug- 
IS te Auaffttirungsformen befinden sich in den UnteransprCLcfaen. 

1^ lacflndnngagemaBes Vmr£9bxm 

20 £s werden nachfolgend mehrere Verf ahr^ und Hardwareinplemen- 
tierungen vorgestellt, die ein effizientes Debuggen von VPU- 
Systemen eriDOglichen. 

Das Debuggen erfolgt in einer bevorzugten Vafiante entweder 
25 durch die Verwendung eines entsprechend an eine VPU oder den 
Baustein angeschlossenen Microcontrollers oder durch eine 
Ziadelogik nach den Patenten P 44 16 881.0-53, 
DE 196 51 075.9-S3, DE 196 54 846-2-53, DB 196 54 593.5-53, 
DE 197 57 200.6-33, DB 198 07 872-2, DE 101 39 170,6, 
30 DE 199 26 538.0, DE 100 28 397.7, die diirch Bezugnahzae 

vollumflinglich eingegliedert sind. Wie ersichtlich sein wird, 
sind aber auch andere Hardware-Varianten verwendbar. 
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Folgende grundlegende Verf ahren sollen alternativ und/oder 
gemelnsam dabel angewendet warden: 

1«X firkennea piner Debiig--Bedingnng 

1.1 >1 Bedlngunq 

Durch den Programmierer wlrd beiapielsweise innerhalb des De- 
bug-Tools elne oder mehrere Bedlngungen festgelegt, die das 
Debugging starten (vgl. Breakpoint nach dem Stand der Tech- 
nik) . Das Auftreten der Bedlngungen wird zur Lauf zeit in der 
VPD und/oder einem beliebigen mit der VPU datenaustauschenden 
Gerat festgestellt. Dies geschieht beispielsweise durch das 
Auftreten von bestinenten Datenwerten bei bestinmten Varlablen 
und/oder bestinenten Trlggerwerten bei bestlnmiten PAEs. 

1,1 >2 Vorbedinqung 

Im Optinalfall kann eine bestijomte Bedingung gemdfi o.g. Defi- 
nition bereits mehrere Takte vor dem Eintreffen der Debug- 
Bedingung durch den Programmierer festgelegt werden. Dadurch 
werden bestimmte Latenz-Problei&e, die im folgenden diskutiert 
werden, von vomherein ausgeschlossen. 

Es sollen im folgenden zwei grundlegende Arten des Debuggings 
ftlr VPDs diskutiert werden^ wobei die jeweils bevorzugt anzu- 
wendende Hethode von der Wahl des CcHqpilers abhangt: 
Far Compilerr die Code auf Basis von instantiierten Modulen 
einer Hardvrarebeschreibungssprache (oder Shnlichen Sprache) 
generieren, kann sich besonders die im folgenden beschriebene 
Methode A eignen. 
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PQr Coinpiler ahnlich DE 101 39 170-6 und Zusatzanmeldungen, 
die konplexe Instruktionen erzeugen und nach einem VLIH- 
ahnlichen Verfahren generieren, eignet sich besonders die im 
folgenden beschriebene Methods B. Grundsatzlich ist fQr den 
5 Betrieb einer VPU cxJer elnes entsprechenden Bausteins als 
Prozessor oder Coprozessor Methode B die bevorzugt anzuwen- 
dende. 

Es wurde erkannt, dass insbesondere die Verwendung beider Me- 
10 thoden A und B gemeinsam zu den best en und transparentesten 
Debuggingergebnissen fahrt. Insbesondere kann je nach Tiefe 
des zu debuggenden Fehlers zunSchst unter Zuhiilfenahme der 
schnellen Debuggingmethode B debuggt werden und nach hinrei- 
chende Lokalisierung des Fehlers sodann per Methode A die De- 
15 tails in der ''Tiefe" analysiert werden. 

a. Mathode A 

20 2.1 Gmn^psfiazip 

Nach dem Auftreten einer {Vor)Bedingung wird die VPD angehal- 
ten. Danach werden die relevanten Debug-Infoxxnationen aus den 
PAEs an das Debug- Progrannft flbertxagen. Die relevanten Debug- 
Infonnationen warden zuvor durch den Progrannaierer innerhalb 

25 des Debug-Programiaes festgelegt. Nach Auslesen aller relevan- 
ter Debug-Informationen wird der n&chste Takt ausgefOhrt und 
erneut die relevanten Debug-Informationen ausgelesen. Dies 
wiederholt sich solange, bis der Programmierer den Debug-* 
Vorgang abbricht. Anstelle des Anhaltens der VPD sind eventu- 

30 ell andere Verfahren denkbar« So JcOnnen f(ir eine gegebene Ab- 
folge von Takten wiederholt Daten zum Auslesen bereitgestellt 
werden, sofem dies schnell genug mfiglich ist. 
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2.2 Untersiiiitsung durch die Saxctvare 
2,2,1 Auslesen der Register 

Wesentlich far die Funktionsweise des Debuggers 1st die M5g- 
5 llchkelt, durch elne ttbergeordnete Elnheit (im folgenden De- 
bugProzessor (DB) genaimt), also belspielsweise elne CT oder 
Ladelogik, einen anderen extern angeschlossenen (Host) Pro- 
zessor oder elnen reservierten Arrayberelchr die intemen Da- 
tenregister und/oder Statusregister und/oder Zustandsreglster 

IQ und ggf • je nach Inqplementierung welt ere relevante Register 
und/oder Slgnale aus den PAEs und/oder dem Netzwerk zurOckzu- 
lesen bzw. dies nur fOr ausgewShlte Register bzw, Slgnale zu 
tun (zusainmengefaAt im folgenden als Debuginfonoation be- 
zelchnet) • Elne derartlge H5gllchkelt ist z. B. zoit der in 

15 der PCT/DE 98/00334 geschaffenen Verbindung zvischen der 
Ladeloglk und dem Datenbus elner PAE (PCT/DE 98/00334 0403^ 
Fig. 4) realisierbar. 

Es soli ausdrtlcklich angemerkt sein, dafi auch serielle Ver- 
20 fahren zum Auslesen der Register verwe^det werden kOnnen. 
Belspielsweise kann JTA6 gewShlt werden und der DB Dber die- 
ses Ver fahren ggf . auch als extemes seperates und eTtl. auch 
marktabliches 6er£Lt (z. B. Firma Hitex, Karlsruhe) ange- 
schlossen sein. 

25 

Da bevorzugt auf s^intliche Register, oder zumindest elne er- 
heblich Anzahl derer, durch den Debugger schrelbend und/oder 
lesend zugegriffen werden kann, kann optional und bevorzugt 
eln wesentlicher Tell der (seriellen) Verkettung der Register 
30 zu Testzwecken (Scan-Chain) far die Produktionstests des 

Chips ent fallen* Die Scan-Chain wlrd normalerweise dafOr ver- 
wendet, um alle Register Innerhalb eines Chips wahrend der 
Produktionstests mlt Testdaten vorladen zu kOnnen und/oder 
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die Inhalte der Register zu Testzwecken wieder zurttckzulesen. 
Das Vorladen und/oder Zurflcklesen geschleht dabei typischer- 
weise durch Testsysteme (z.B. SZ Testsysteme, Amerang] 
und/oder gesiSfi den In der DE 197 57 200.6-33 beschriebenen 

5 Verfahren. Die Scan-Chain bendtigt dazu einen zus^tzlichen 
nicht unerheblichen Hardware- und Flachenaufwand fUr jedes 
Register. Dieser kann nunmehr, zumindest fQr die Register, 
die debugbar sind, entfallen, wenn - wie erflndungsgemaB vor- 
geschlagen - die Produktionsteststnlagen uber geelgnete 

LO Schnittstellen (z.B. parallel, seriell, JTAG, etc.) Zugriff 
auf die Register erhalten. 

2.2-2 Anhalten oder Verlanqsamen des Taktes 

IS Durch das Auftreten von Bedingung und/oder Vorbedingung kann 
der Takt entweder angehalten oder verlangsamt werden, urn bin- 
reichend Zelt zum Auslesen zur VerfQgung zu stellen. Ausge- 
I58t wird dieser Debugbeginn insbesondere entweder direkt 
durch eine PABt die die (Vor) Bedingung (en) berechnete oder 

20 durch eine ^ergeordnete Einhelt (z. Ladelogik/CT, Host- 
prozessor) aufgrund belleblger Aktlonen, belspielsweise durch 
die Infomatlon, daB an einer PAB eine (Vor) Bedingung auftrat 
und/oder durch eine Aktion Izmerhalb des DebugProzessors 
und/oder durch ein beliebiges Programm und/oder eine beliebi- 

•25 ge exteme/perlphere Quelle. Zum Informieren stehen Trigger- 
mechanismen entsprechend P 44 16 881.0-53, DE 196 51 075.9- 
53, DE 197 04 728.9, DB 198 07 872.2, DB 198 09 640.2, DE 100 
28 397.7 zur VerfQgung. Altematlv kann beim Debuggen der 
Takt generell verlangsamt werden. Sollen nur Arraytelle de- 

30 buggt werden, kann eine partielle Heruntertaktung vorgesehen 
werden. 
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Sofern der Talct verlangsamt wird, muss durch den Debugprozes-- 
sor Innerhalb des verlangsamten Zyklus des Verarbeitungstak- 
tes aXle relevante Debug- Information aus den PAEs ausgelesen 
werden. Dazu ist es sinnvoll und bevorzugt, den Takt nur par- 
5 tiell zu verlangsamen, also den Arbeit stakt zu senken Oder 
anzuhalten, aber den Takt far den Auslesemechanismus welter 
fortzufahren, Des weiteren ist es sinnvoll und beyorzugt, ge- 
nerell die Register zum Datenerhalt mit Takt zu versorgen. 

10 Nach dem Anhalten des Taktes kaim ein Single-Step Modus rea- 
lisiert werden, d»h- der Debugprozessor halt den Verarbei- 
tungstakt so lange an, bis er alle Debug-Information ausgele- 
sen hat. Demach startet er den Verarbeitungstakt wieder fOr 
einen Zyklus und halt ihn erneut bis nach dem Auslesen aller 

15 relevanten Debug- Informationen an. 

Der Auslesetakt und der Takt des Debug-Frozessors sind bevor- 
zugt unabhangig vom Verarbeitungstakt der PAESr so dafi die 
Datenverarbeitung vena Debugging und insbesondere Auslesen der 
20 Debug- Information getremit ist» 

Hardwaretechnisch wtrd das Anhalten oder Verlangsamen des 
Taktes durch Methoden nach dem Stand der Technik, wie bei- 
spielsweise Gated-Clocks und/oder PLLs und/oder Teller oder 

25 andere Verfahren erreicht. Diese Mittel werden bevorzugt an 
geeigneten Stellen (Khoten) innerhalb des Clock-Trees einge- 
fUgt^ so dafi eine globale Tafctsteuerungen der jeweils tiefer- 
liegenden Zweige realisierbar ist. Die Ueruntertaktung nur 
von ausgewahlten Arrayteilen ist in den unter Bezug gencxmne- 

30 nen Anmeldungen des vorliegenden Anmelders offenbart. 

Besonders bevorzugt ist das Versenden einer Taktsteuer- 
Information von einer tlbergeordneten Elnheit (z.B. Ladelo- 
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qik/CT, Hostprozessor) an s^tllche bzw. simtliche zu debug- 
genden PAEs. Dies kann bevorzugt iiber das Konfigurationsbus- 
system erfolgen. Die Taktsteuerlnformatlon wird dabei typi- 
scherweise gebroadcastet iibertragen, d.h. alle PAEs erhalten 
5 dieselbe Infoxiziatlon* 



Belspielsweise konnen folgende Taktsteuerinfozmatlonen imple- 
ment lert sein: 

10 STOP: Der Arbeit stakt wird emgehalten. 
SLOW: Der Arbeitstakt wird verlangsamt. 
STEP: Exakt ein Verarbeitungsschritt (Single Step Modus) 
wird ausgeflihrt und dann der l^beitstakt wieder an- 
gehalten . 

15 STEP (n) : n Verarbeitungsschritte werden ausgeflihrt und dann 
der Arbeitstakt wieder angehalten. 
GO: Der Arbeitstakt Iduft nonoal weiter. 



Es soli insbesondere erwdhnt sein, dass das Verfahren der 
20 Taktabschaltung und/oder VerlangsamungT ebenso eingesetzt wer- 
den kann^ urn den StromTerbrauch zu reduzieren. Sofern tespo- 
rlUc kelne Rechenlelstung benatigt wird, kann ein "Sleepmode" 
belspielsweise durch das Abschalten des Arbeitstaktes (STOP) 
Oder durch spezielle Befehle (SLEEP) realisiert werden. ffird 
25 nlcht die voile Rechenlelstung bendtigt, kann der Takt durch 
die Verwendung von SLOW verlangsaznt werden und/oder ten^or&r 
durch STBP(n) ausgesetzt werden. Insoweit ist das Verfahren 
optional und/oder zusdtzlich zu den in der DB 102 06 653.1 
beschrlebenen Verfahren zur Reduzierung der Verlustleistung 
30 einsetzbar. 



Ein Problem des Broadcastings von Taktsteuerinfonoationen ist 
die Obertragungszeit des Broadcastes durch das Array aus 
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PAEs. Die Obertragung kann bei hdheren Taktfrequenzen nicht 
innerhalb eines Arbeitstalctes erfolgen. Es 1st aber zwlngend 
notwendig, dass eamtliche PAEs zur gleichen Zeit auf die 
Taktsteuerinformationen reagieren. Bevorzugt wird die Takt- 
steuerinformation daher (iber ein gepipelintes Bussystem ahn- 
lich des in DE 100 28 397.7 beschriebenen CT-Bussystems ttber- 
tragen. Weiterhin wird ein Zahlenwert (LATVAL) den Taktsteue- 
rinformationen hinzugefttgt: der glelch oder grCfler der maxiina- 
len Lange der Pipeline des Bussystems ist. In jeder Pipeli- 
nestufe wird taktwaise der Zahlenwert dekrementiert (Subtrak- 
tion von 1) . Jede PAE, die die Taktsteuerinf ormation erhalt, 
dekrementiert im weiteren den Zahlenwert mit jedem Takt. Da- 
mit ist siohergestellt, dass der Zahlenwert In dem gepipelin- 
ten Bussystem und den PAEs, die die Takt steuerinformat ion be- 
reits empfangen haben, immer exakt gleich 1st. Erreicht der 
Zahlenwert den Rert 0, ist siohergestellt, dafi alle PAEs die 
Taktsteuerinformation erhalten haben. Jetzt tritt die Takt- 
steuerinf ormation in Kraft und das Verhalten des Taktes wird 
entsprechend modifiziert. 

Durch das beschriebene Verfahren entsteht eine weitere La- 
tenzzeit (Latency). Dlese kann beisplelswelse * durch die nach- 
folgend beschriebene Registerpipellne zus^tzlich abgefangen 
werden, oder, wie besonders bevorzugt, durch die Definition 
der {Vor)Bedingung abgefangen werden, indem die {Vor)Be- 
dingung soweit vorgesetzt wird, dafi die Latenzzeit bereits 
berQcksichtigt ist. 

Bs soli besonders erwahnt werden, dafi die Latenzzeit im Sin- 
gle-Step Modus vemachlassigbar ist, da sie nur bei der Ab- 
schaltung es Taktes (STOP) eine Rolle spielt. Da der Befehl 
STEP immer nur exakt einen Schritt ausftthrt, kommt es w£Lhrend 
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des Single-Step Betriebes durch Jceinerlei Verfalschung (Ver- 
zSgerung) der Debugdaten durch die Latenzzeit. 

5 2,2,3 Registerpipeline zum Ausgleichen der Latency 

Bei hohereix Betriebsfrequenzen kann es zu einer Latenzzeit 
zwischen dem Erkennen des Debugbeginns und dem Anhalten oder 
Verlangsamen des Taktes kommen- Diese Latenzzeit ist exakt 
vorherbestirnmbar, da die Position der verz5gemden Register 

10 in der VPU durch Hardware und/oder den zu debuggenden Algo- 
rithraus definiert und durch den Debugger daher exakt bere- 
chenbar ist. 

Durch die Latenzzeit verschieben sich jedocb die dem Debug- 
15 Prozessor zur Verftlgung gestellten Infonnationen derart, dafi 
nicht inehr die korrekten Debuginformationen ausgelesen werden 
k«nnen. Bevorzugt wird dies durch ein entsprechendes Festle- 
gen der (Vor)Bedingung durch den Programmierer gele^st. Optio- 
nal kann durch das Binfiigen einer mehrstufigen Registerpipe- 
20 line^ die die Debuginformation in jed^ Takt urn ein Register 
weiter tteertragt, der Debugprozesaor auf so viele Takte an 
Debuginformationen zuruckgreifen, wie die Registerpipeline 
lang ist. Die L§nge der Registerpipeline ist so auszulegen, 
daB sie der roaximal zu erwartenden Latenz entspricht« Auf- 
25 grund der exakten Berechenbarkelt der Latenzzeit ist es nun- 
mehr den Debug-Programm mOglich, die zeitlich korrekte, rele- 
vante Debug-Information aus der Registerpipeline auszulesen. 

Ein auftretendes Problem bei der Verwendung von Registerpipe- 
30 lines ist, dafi diese verhaitnlsmaBig lang und damit, bezogen 
auf die fiir die Realisierung notwendige Siliziumfiache, teuer 
sind. 
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2.3 SicOitbare Debug-Iafoxinationeii 

Bei dieser Methode wird im wesentlichen nach Auftreten der 
5 (Vor)Bedingung debugt^ da erst danach der Takt verlangsamt 
Oder angehalten wird und das Auslesen der Debug-Information 
erfolgt, Debug-Informationen, die vor dem Auftreten der 
(Vor)Bedingung liegen^ sind daher zunSchst nxcht sichtbar. 

10 Es ist jedoch, wenngleich auch unter Verluat an Arbeitslei- 
stung, m5glich eine VPO sof ort vom Start einer Applikation an 
mit verlangsamten Takt Oder Single-Step-Modus zu betreiben, 
Vom Start an warden die relevanten Debug^Informationen voia 
Debug-Prozessor ausgelesen. 

15 

3. MBVbodm B 
3.1 Gxiin^prinsip 

20 

Relevante IDebug-Informationen aus den Speicherelnheiten, die 
gemafi P 44 16 881.0-53, DE 196 54 846.2-53, DB 199 26 538.0^ 
Dfi 101 39 170.6 und deren Zusatzanmeldungen, D£ 101 10 530.4 
die Anwendungsdaten und ZustSnde eines bestimmten Arbeits- 

25 schrittes beinhalten, werden an das Debug-Prograima tlbertra- 
gen. Diese Speichereinheiten, nachfolgend auch Arbeitsspei- 
cher genannt, arbeiten im Maschinenmodell nach der P 44 16 
881,0-53, DE 196 54 846,2-53, DE 101 39 170.6 und deren Zu- 
satzanmeldungen, DB 199 26 538 «0, DB 101 10 530.4 quasi als 

30 Register zur ' Speicherung von Daten, die innerhalb eines Kon- 
figurationszyjauses im PA oder Teilen des PAs berechnet wur- 
den. Es wird insbesondere auf die Patentanmeldung DE 101 39 
170.6 und deren Zusatzanmeldungen verwiesen, in der die Ver- 
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wendung der Speichereinheiten als Register (ElEG) zur Reali- 
sierung eines Prozessormodells detailliert beschrleben ist. 
Die DE 101 39 170.6 iind deren Zusatzanmeldungen sind zu Of- 
fenbarungszwecken vollumfanglich eingegliedert . Eine Spei- 
5 chereinheit besteht dabei aus einer belieblgen Anordnung und 
Hierarchie von unabhangigen und abhSngigen Speichern. Es ist 
ni5glich, gleichzeitig mehrere xmterschiedliche Algorithmen 
auf dem PA {Processing Array) auszufiihren, die dann unter- 
schiedliche Speicher verwenden. 

10 

Wesentlich fiir die Anwendung dieser Methode ist, da£ Daten 
und/oder algorithmisch relevante ZustSnde in die den PAEs zu- 
geordneten Speichereinheiten abgelegt sind, wobei eine Spei- 
chereinheit jeweils zumindest derart dlmensioniert ist, dafi 
15 alle relevanten Daten und/oder Zustande eines Zylclus gespei- 
chert werden kOnnen; hierbei kann die LSnge eines Zyklus 
durch die 6r06e der Speichereinheit bestimmt sein und ist es 
bevbrzugt auch (vgl. DE 196 54 B46-2-53). Mit anderen Worten 
vird die Zykluslfinge der Hardware angepaQt. 

2(1 

Unterschiedliche Daten und/oder ZusteUide werden derart in die 
Speichereinheiten gespeichert, daB diese eindeutig dem Algo- 
rithmus zugeordnet werden kOnnen- Dadurch kann der Debugger 
die relevanten Daten und/oder Zustande (Debug-Infotmation) 
25 eindeutig identifizieren. 

Die relevanten Debug-Infonnatlonen kannen - inabesondere auch 
vorab - durch den Progranmierer innerhalb des Debug-Pro-- 
grarames. festgelegt warden, Diese Debug-Informationen werden 
30 aus den Speichereinheiten ausgelesen, Dazu stehen unter- 

schiedliche Methoden zur VerfUgung; einige M5glichkeiten wer- 
den nachfolgend nSher beschrieben. Nach dem Auslesen aller 
relevanter Debug-Inf onnationen wird der nSchste Konf igurati- 
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onszyklus ausgeflihrt und emeut die relevanten Debug-Infor- 
mationen ausgelesen. Dies wiederholt sich so lange, bis der 
Programmierer/Debugger den Debug-Vorgang abbricht. 

5 Mit anderen Worten werden die relevanten E}atea und/oder Sta- 
tusinformationen nicht taktweisO/ sondem konfigurationsweise 
an den Debugger libertragen. Dies geschieht aus den Spei- 
chereinheiten, die mit den Registem einer CPU vergleichbar 
sind. 

10 

3*2 Ifoterstfitmig cinrcTt die aardsraxe 

ffesentlich far die Funktionsweise des Debuggers ist die Mdg- 
15 lichkeit, durch die CT Oder einen anderen extern angeschlos- 
senen Prozessor (im Folgenden DebugProzessor (DB) genannt) , 
die beispielsweise auch interne (n) Arbeitsspeicher der VPU zu 
lesen. Sine derartige H()glichkeit ist z.B. durch den Anschluft 
der CT an die Arbeitsspeicher ziam Vorladen und Lesen der Da- 
20 ten und/oder durch die in der DE 199 26 538.0 beschriebene 
Verfahren zum Herausschrelben der internen Speicher an exter- 
ne Speicher gegeben. In einer m5gliche Ausgestaltung kann auf 
Arbeitsspeicher durch verschieden Verfahren nach dem Stand 
der rechnik (z.B. Shared Heiooryf Bank Switching) dereurt vom 
25 DebugProzessor zugegriffen werden^ dass der Datenaustausch 
mit den DB weitestgehend unabhSngig Ton einer weiteren Daten- 
verarbeitung in der VPO erfolgen kann. 

In einer naglichen Ausgestaltung kann z. B. entsprechend He*- 
30 thode A durch eine Oder mehrere der vorsteKend beschriebenen 
HaBnahmen der Takt der VPU zum Auslesen der Speicher gegebe- 
nenfalls entweder entsprechend verlangsamt oder cuigehalten 
werden und/oder gegebenenfalls im Single-Step-Modus betrieben 
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werden- Dabei kann je nach Implementierung der Arbeit sspei^ 
Cher, z. B. beim Bank-Swltch-Verfahren^ auf einen besonderen 
Eingriff In den Takt verzlchtet werden^ Typlscherwelse ge- 
schieht das Anhalten oder Verlangsamen des Taktes nach Hetho-* 
5 de B und das Auslesen und/oder Kopieren und/oder Umschalten 
der Arbeit sspeicher nur/ wenn eln Datenverarbeitungszyklus 
bzw. Konfiguratlonszyklus beendet ist. 

Mlt anderen Worten ist eln wesentllcher Vortell von Methods 
10 B, dass kelne besondere Unterstdtzung durch die Hardware er- 
forderlich 1st. . 

In einer m5gllchen Ausgestaltung mufi eln DB ledlgllch Zugriff 
auf die Arbeltsspelcher besltzen. In elner besonders zu be- 
15 vorzugenden Ausgestaltung geschleht der Zugriff auf die Ar- 
beltsspelcher -durch elne geeignete Konflguratlon der VPU, die 
dadurch die Arbeltsspelcher selbst&adlg und ohne Nodlflkatlon 
ausllest und an einen DB tibertrSgt. 

20 

3.3 Zogzi£f axi£ Odrag^Infoxmation 

In der P 44 16 881.0-53, DE 196 54 846.2-53, DS 101 39 170.6, 
DE 199 26 538.0 slnd Datenverarbeitungsverfahren beschrleben, 

25 bel denen zykllsch elne Menge an Operatlonen auf einen rekon- 
flgurlerbaren Datenverarbeitungsbausteln abgeblldet werden. 
In jedem Zyklus wlrd eine Mehrzahl von Daten berechnet, die 
von einer perlpheren Quelle und/oder einen intemen/extemen 
Arbeltsspelcher stammen und an elne perlphere Quelle und/oder 

30 ^Inen Internen/extemen Arbeltsspelcher geschrleben werden. 
Dabei kSnnen jeweils unterschledliche und/oder vor allem meh- 
rere unabhSngige Arbeltsspelcher gleichzeltig verwendet wer- 
den. Belspielswelse kOnnen in diesem Datenverarbeltungsver- 
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fahren die Arbeitsspeicher Oder ein Teil der Arbeitsspeicher 
als Regist ersatz dienen. 

Nach der DB 101 39 170.6 und der DE 199 26 538-0 warden dabel 
5 aamtliche Daten und ZustSinde, die fQr die weitere Datenverar- 
beitung relevant sind, in die Arbeitsspeicher abgelegt 
und/oder aus selbigen gelesen« In einem bevorzugten Verfahren 
werden fttr die weitere Datenverarbeitung irrelevante ZustSnde 
nicbt gespeichert. 

to 

Die Unterscheidung zwischen relevanten und Irrelevanten Zu- 
sttoden soil an folgendem Beisplel aufgezeigt werden, es soli 
zu Offenbarungszwecken dabel insbesondere auf die AusftUirun- 
gen in der DC 101 39 170.6 verwiesen werden: 

15 

Die Zustandsinfonnation eines Vergleichs ist beispielsweise 
for die weitere Verarbeitung der Daten wesentllch, da dieser 
die auszufOhrenden Funktionen bestinoQt. 

20 Ein sequenzieller Dividierer entsteht beispielsweise durch 
Abbildung elnes Divisionsbefehles auf eine Hardware, die nur 
die seguenzielle Division unterstdtzt. Dadurch entsteht ein 
Zustand, der den Rechenschritt innerhalb der Division kenn- 
zeichnet. Dieser Zustand 1st irrelevant, da ft!lr den Algorithm 

25 mus nur das Brgebnis (also die ausgeftthrte Division) erfor- 
derlich ist. In diesezn Fall werden also ledlglich das Ergeb- 
nis und die Zeitinfonoatlon (also die Verftkgbarkeit) bend- 
tigt. 

30 Die Zeitinfozznation ist beispielsweise in der VPU-Technologie 
nach P 44 16 881.0-53, DE 196 51 075.9-53, DE 199 26 538.0 
durch das RDY/ACK Handshake erhaitlich. Hierzu ist jedoch be- 
sonders anzumerken, daQ das Handshake ebenfalls keinen rele- 
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vanten Zustand darstellt, da es lediglich die GUltigkeit der 
Daten slgnalisiert, wodurch slch wiederum die verbleibende 
relevate Information auf die Existenz gtiltiger Daten redu- 
ziert^ 

5 

In der DE 101 39 170.6 wird eine Unteracheidung zwischen lo- 
kal und global relevanten Zust&iden aufgezeigt: 

lokal: Der Zustand ist nur innerhalb einer einzigen eUbge- 
10 schlossenen Konflguration relevant* Daher mufi der Zustand 
nicht zwingend gespeichert werden. 

global: Die Zustandsinformation wird ftir mehrere Konflgura- 
tionen benOtigt. Der Zustand mufi gespeichert werden. 

15 Bs ist nunmehr denkbar^ dafi der Progratnmterer einen lokal re- 
levanten Zustand debuggen will, der nicht in den Speichem 
abgelegt ist. In diesem Fall kann die Applikatlon dahingehend 
modifiziert werden, dafi eine Debug-Konfiguration entsteht 
(aquivalent zum Debug-Code von Prozessoren) ^ die eine Modifi- 

20 kation zum "normalen" Code der Applikation derart aufweist/ 
dafi dieser Zustand zusdtzlich in die Speicheteinheit ge- 
schrieben und daniit dem Debugger zur Verfagung gestellt wird. 
Dadurch entsteht eine flbweichung zwischen Debug-Code und tat- 
s&chlichem Code, die zu einem unterschiedlichen Verhalten der 

25 Codes fflhren kann. 

In einer daher besonders bevorzugten Ausfdhrung wird keine 
Debug-Ronfiguration verwendet. Vielmehr wird die zu debuggen- 
de Konflguration derart terxainiert, dass die for Debugging- 
30 zwecke zusatzlich erforderlichen Daten die Terminierung Ober- 
dauern, d.h. weiterhin gttltig in den entsprechenden Speicher- 
stellen (REG) (z.B. Register, ZShler, Speicher) verblelben. 
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Wenn die zu debuggende Konflguration deraxt termlniert wlrd, 
dafi die ftir Debugging-Zwecke zus^tzlich erf orderllchen Daten 
die Teminierung Hberdauem, ist es mdglich, ein Debuggen 
einfach dadurch durchzufiihren, daB nicht die nachste, bei 
5 nomalem Prograznznablauf erforderliche Konflguration geladen 
wlrd, sondern stattdessen elne Konflguration, tU>er welche die 
zu den Debugging-Zwecken erforderlichen Daten in die Debug- 
Einheit bzw. das Debug-Mlttel Qbertragen werden. Es sei dar- 
auf hingewlesen, dafi bei einam solchen Debuggen auch im spa- 
te teren Ablauf des Prograzmaes stets die zu Debug*Zwecken erfor- 
derlichen Daten loit abgespeichert werden kSnnen, wodurch si- 
chergestellt ist, daft das spSter ausgefohrte Progranoa in ex- 
akt der Vfelse einem Debug- ProzeA unterworfen worde wle erfor- 
derliche Nach Auslesen der Debug- Information durch elne dedi- 
15 zierte Debug-Konfiguration kann dann mlt der normalen Pro- 
grammausftUirung fortgefahren werden. 

Bine Konflguration wird geladen, dlese verblndet die REG in 
geeigneter Weise und def inierter Reihenfolge mit ^inem odex 
20 mehreren globalen Spelcher(n), auf di^ der DB Zugriff hat 
(z.B. Arbeitsspeicher) . 

Vorgeschlagen wlrd also, dafi elne Konflguration geladen wlrd, 
dlese die REG in geeigneter Relse verblndet und in definler- 
25 ter Reihenfolge mlt einem oder mehreren globalen Speichem 
verblndet, auf die der DB Zugriff hat (z. B« Arbeitsspei- 
cher) . 

Die Konflguration kann beisplelswelse Adressgeneratoren ver- 
3D wenden^ um auf den/dle globalen Spelcher zuzugreifen. Die 
Konflguration kann beisplelswelse Adressgeneratoren verwen- 
den, um auf als Spelcher ausgestaltete REG zuzugreifen. Ent- 
sprechend der konfigurlerten Verbindung zwlschen den REG wer- 
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den die Inhalte der REG in einer definierten Reihenfolge in 
den globalen Speicher geschrieben, wobei die jeweiligen 
Adressen von Adressgeneratoren vorgegeben werden. Der Adress- 
generator generiert die Adressen ftir den/die globalen Spei- 
5 cher(n) derart, dafi die beschriebenen Speicherbereiche {DBBU^ 
GINFO) der entfemten zu debuggenden Konfiguration eindeutig 
zugeordnet werden k5nnen. 

Das Verfahren entspricht dera Kontext-Switch in DE 102 06 
10 653.1 und DB 101 39 170,6, die zu Offenbarungszwecken vollum- 
fanglich eingegliedert sind. 

Der DB kann nuniaehr auf die Daten innerhalb eines ihm zugang- 
lichen Speicherbereiches (DEBDGINFO) zugxeifen. Soli das De- 

15 bugging mittels eines Single-Step Verfahrens durchgeftUirt 

werden, kann nach jedem single step einer asu debuggenden Kon- 
figuration ein Kontext-Switch derart durchgeflihrt werden, 
dass saiatliche Daten erhalten bleiben und die zu debuggende 
Information aus den REG in einen Arbeitsspeicher geschrieben 

20 wird. Sodann wird wiederum unter Erhalt der Daten die zu de- 
buggende Konfiguration wieder konfiguriert und ftir einen wei^ 
teren single step ausgefiihrt. Dies geschieht far jeden zu de- 
buggenden single step der zu debuggenden Konfiguration. Auf 
die M6glichkeit eines Debugging unter Verwendung der als ^Ha- 

25 ve-Rekonfiguration'" bekannten Prinzipien sei hingewiesen. 

3.4 Slohtbace Debng-Informationen 

30 Bin Debuggen vor der (Vor) Bedingung kann vergleichsweise ein- 
fach und ohne grofie Performance-Verluste durchgeftlhrt werden, 
da die benotigten Debug-Infonaationen in Arbeitsspeichem 
verfUgbar sind, Durch das Obertragen der Arbeitsspeicher in 
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andere Speicherbereiche, auf die der DB bevorzugt direkten 
Zugriff hat/ kann die Debug- Information einfach sicherge- 
stellt werden. Elne nocb schnellere Methode ist, die Arbeits- 
speicher duxch ein Bank-Switching-Verfahren (nach dem Stand 
3 der Technik) derart zwischen den einzelnen Konfigurationen 
^umzuschalten, da6 die £)ebug-InfonRation in einer jeweils neu- 
en Bank liegt. Das Umschalten kann sehx zeitoptinderendr im 
Optimalfall sogar ohne Auswirkung auf die Verarbeitungslei- 
stung erfolgen. 

10 

Es ist bereits offenbaart worden, dafl bei einer VPU Daten 
blockweise in einen Speicherbereich tibertragen werden k5nnen. 
Oieser kaim auch auBerhalb des eigentlichen PA llegen 
und/oder einen Dual-Port ed-RAM Oder dergleichen aufweisen, so 
IS dafi es m5glich ist, auf die eingeschriebene Information von 
aufien leicht zuzugreifen. 

4, Htmttlongiroiaq des Pcibnggerg 

20 

Das Debugger-FrograninL aelbst kann auf einem DB auAerhalb des 
BAs ablaufen. Alternatiy dazu kann eine VPU selbst den DB 
darstellen, entsprechend der Hethoden, die bei Prozessoren 
angewendet werden. Dazu kann ein Task-- oder Kontextswitch 

25 (SWITCH) entsprechend den Ausftthrungen in PACTll ausgeftihrt 
werden. Die Debuginfonaationen des zu debuggenden Programmes 
werden bei einena SWITCH zusainmen mit den relevanten Daten ge- 
sichert und das Debugger Programm geladent das die Informa- 
tionen auswezrtet un^/oder interaktiv mit dem Prograznmierer 

30 verarbeitet. Danach wird erneut ein SWITCH durchgeftihrt {bei 
welchem die relevanten Inf ormationen des Debuggers gesichert 
werden) und das zu debuggende Programm wird weitergeftihrt. 
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Es sei auch erw^hnt, daA als Debugger ein Prozessor-Teil- 
bereich vorgesehen warden kann. 

Die Debug- Information wlrd vom Debugger entsprechend Metbode 
S A und/oder B gelesen und in einen von der Datenverarbeitung 
separaten Speicher und/oder Speicherbereich gespeichert, auf 
den der DB bevorzugt direkten Zugriff besitzt. Durch das De- 
bugger- Prograinm werden die Brea]q>oint9 und {Vor)Bedingungen 
definiert. Ebenfalls kann das Debugger-Progranm die Kontrolle 
10 tlber die Ausfiihrung der Applikation, insbesondere den Ausftih- 
rungsstart und das AusfOhrungsende Ubemehmen. 

Der Debugger stellt dem Programmierer eine geeignete Arbeits- 
umgebung zur Verftigung mit ggf • graphiscber Oberfldche. In 

15 einer besonders bevorzugten AusfUhrung ist der Debugger in 
eine konplese Bntwicklungsumgebung integriert und tauscht mit 
dieser Daten und/oder Steuerinformation aus. Insbesondere 
kann der Debugger die aus den Arbeitsspeichem gelesenen Da- 
ten zur beliebigen Weiterverarbeitung auf einen DatentrSger 

20 (Festplatte, CDROH) speichern und/ode£ innerhalb eines Netz- 
werkes (wie Ethernet) ablaufen. 

Der erfindungsgemafie Debugger kann zudem gemMfi DE 101 29 
237.6-53 innerhalb einer Entwicklungsumgebung mit anderen 

25 Verkzeugen und insbesondere auch Debuggem kqnimunizieren; wo- 
bei in einer bevorzugten Ausgestaltung die Steuerung und/oder 
Definition der Debugparameter von eineia anderen Debugger aus 
ilbemommen werden kann. Ebenso kann der Debugger die von ihm 
generierte Debug-Inf ormation einem anderen Debugger zur Ver- 

30 fflgimg stellen und/oder von diesem dessen Debug-Information 
erhalten. 
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iQsbesondere das Feststellen des Auftretens von BreaJqpoints 
und/oder (Vor) Bedingiing xst durch einen anderen Debugger bzw. 
den Einheiten^ die dieaer andere Debugger debugt, durchfiihr- 
bar, Der erfindungsgemafie Debugger and die VPU reagieren dann 
5 entsprechend. 

Der andere Debugger kann insbesondexe der Debugger eines mit 
einer VPU gekoppelten anderen Prozeasors (CT^ bzw. ARC bei 
Chameleon, Pentium, AMD usw. ) sein* 

10 

Insbesondere kann der andere Debugger auf einem der VPU zuge- 
ordneten und/oder gekoppelten Prozessor ablaufen und/oder der 
zugeordnete Prozessor der DB seln, beispielsweise eine CT 
bzw. ARC bei Chameleon. In einer besonders bevorzugten Ausge- 
15 ataltung kann der zugeordnete Prozessor ein Host-Prozessor 
seln, wie beispielsweise in der 60/317,876 und/oder der DE 
102 06 856.9 beschrieben. 

20 5. Bewertnng der Mathodan 

Die Methode A ist erheblich zeit- und ressourcenintensiver 
ala die Methode B, bei der kaum zusStzliche Hardware erfor- 
derlich ist und zudem ggf • das zeltaufwendige Auslesen der 
25 Debug-lnformatlon vom Start der j^PPli^cation an entf^llt. Da- 
her ist Methode B grundsdtzlich vorzuziehen. FQr Con^iler 
nach DE 101 39 170.6 und deren Zusatzanmeldungen ist die Me- 
thode B eindeutig zu prftferieren. 

30 Es wurde erkannt, dafi insbesondere die Verwendimg beider Me- 
thoden A und B gemeinsam zu den besten und transparentesten 
Debuggingergebnissen ftthrt* Insbesondere kann je nach Tiefe 
des zu debuggenden Fe2ilers zunSchst unter Zuhilfenahme der 
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schnellen Debuggingmethode B debuggt warden und nach hinrei- 
chende Lokalislerung des Fehlers sodarni per Methode A die De- 
tails in der "Tiefe** analysiert werden. 

5 

6. Mixed Mode Debogger 

Bei der Anwendung der besonders bevorzugten Methode B kann es 
zu dem Problem kommentr dass die in den Speichem befindliche 
10 sichtbare Information nicht hinreichend ist. 

Typischerweise kann ein detaillierteres Debugging folgender- 
massen erfolgen: 

a) Die sichtbare Debuginformation (PREINPO) vor der Konfigu- 
ration einer einen Breakpoint enthaltenden Konfiguration 

15 wird geaichert. Bei Auftreten elnes Fehlers bei dem Bre- 

aJ^int wird die dann sichtbare Debuginformation (POSTIN- 
FO) gesichert. Basierend auf der PRBINFO Information wird 
ein Software-Simulator gestartet, der die zu debuggen- 
de(n) Konfiguration (en) simuliert. Der Simulator kann da- 

20 bei jeden Wert innerhalb der PAEs \ind der Bussyaterae be- 

stimmen und (ggf . auch graphisch und/oder textuell) aus- 
geben, wodurch ein detaillierter Einblick in den Ablauf 
des Algorithmus zum Zeitpunkt des Auftretens des Fehlers 
erreicht wird. Insbesondere ist es mftglich^ die jeweils 

25 slmulierten Berte mit den Werten von POSTINFO zu verglei- 

chen^ urn Differenzen schnell zu erkennen. 

b) Die sichtbare Debuginformation vor einem Breakpoint wird 
geaichert. Bei Auftreten eines Breakpoints wird basierend 

30 auf dieser information ein Software-Visualisierer gestar- 

tet. Der zu debuggende Baustein wird nunmehr in einem 
Single-Step Verfahren betrieben, das das Auslesen sSmtli- 
Cher relevanter Daten nach Methode A erm5glicht. Diese 
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Daten kOnnen ntmmehr entweder direkt (ggf- auch graphisch 
und/oder textuell) ausgegeben warden und/oder an einen 
Simulator weitergeleitet warden, dessen Simulation sodann 
auf den detalllierteren Daten beruht, und danach wie be- 
5 kannt ausgegeben werden. 

6,1 Voacteile eiaos Mixad-Mbde-Debaggers 

10 Der Mixed-Mode-Debugger ermdglicht die detaillierte Analyse 
der Ablaufe innerhalb eines Bausteines. Durch- die Mogllchkeit 
gemafi Methode bis zu einem gesetzten Breakpoint mit vollex 
Geschwindigkeit zu arbeiten und danach ggf. anzuhalten/ zu 
verlangsamen und/oder ggf. in einen Single-Step-Modus zu ge- 

15 hen/ wird das Debugging zeiteffizientr wodurch das Testen 
groBer Datenmengen und/oder koin>lexer Algorithmen ermoglicht 
wird. Das bevorzugte Aufsetzen eines Simulators nach dem Auf- 
treten des Breakpoints auf Basis der aktuellen Daten und Zu- 
stande erm«glicht einen genauen Einblick in die Hardware. So- 

20 fern der Zeitaufwand fOr die Simulatidn zu hoch ist und/oder 
die 100% ObereinstinHnung des Simulators mit der Hardware 
f raglich ist, ermOglicht das ZurQcklesen von Daten im Single- 
Step-Modus nach Auftreten eines Breakpoints geaafl Methode A 
Oder entsprechend des Kontext-Swltch Verfahrens nach DB 102 

23 06 653.1 imd DE 101 39 170.6 ein 100% korrektes Debugging des 
Algorithmus und/oder auch der Hardware selbst- 

7. Beschreibuncr der FiqurcMn 

30 

Figur 1 und 2 entsprechen der Patentanmeldung DE 101 39 
170.6. Die unterschiedlichen tasStze der Methoden A und B 
wurden in die Piguren eingezeichnet (A, B) 



wo D3/D23616 



24 



PCT/DE02/03278 



Fignx lb zeigt eine Reprasentation des endlichen Autamaten 
durch eine rekonf igurierbare Architektur nach P 44 16 881.0- 
53 und DE 196 54 846.2-53 (DE 196 54 846.2-53, Fig. 12-15). 

5 Das kombinatorischen Netz aus Figur la (0101) wird durch eine 
Anordnung von PAEs 0107 ersetzt (0101b) • Das Register (0102) 
wird durch einen Speicher (0102b) ausgefuhrt, der mehrere Zy- 
klen speichem kann. Die Rtlckkopplung gemaU 0105 erfolgt 
durch 0105b. Die Eing^nge (0103b bzw. 0104b) sind Squivalent 

10 0103 bzw 0104. Der direkte Zugriff auf 0102b kann ggf. durch 
einen Bus durch das Array 0101b realisiert werden. Der Aus- 
gang 0106b ist wiedeinjia Squivalent 0106. 

Pigur 2 zeigt die Abbildung eines endlichen Automaten auf ei- 
15 ne rekonf igurierbare Architektur- 0201(x) reprSsentieren das 
kombinatorische Netz (das entsprechend Figur lb als PAEs aus- 
gestaltet sein kann) . Bs existiert ein oder mehrere Speicher 
fttr Operanden (0202) und ein oder mehrere Speicher ftir Ergeb- 
nisse (0203) . ZusStzlich Oaten Ein-ZAusgSnge gem. 0103b, 
20 0104b, 0106b) sind der Einfachheit halber nicht dargestellt- 
Den Speichem zugeordnet ist jeweils ein Adressgenerator 
(0204, 0205). 

Die Operanden- und Ergebnisspeicher (0202, 0203) sind physi- 
kalisch oder virtuoll derart miteinander verkoppelt, dafi bei- 

25 spielsweise die Ergebisse einer Funktion einer anderen als 
Operanden dienen kOnnen und/oder Ergebnisse und ()peranden ei- 
ner Funktion einer anderen als Operanden dienen kGnnen- Eine 
derartige Kopplung kann beispielsweise durch Bussysteme her- 
gestellt werden oder durch eine (Re) Konf iguration, durch wel- 

30 che die Funktion und Vemetzung der Speicher mit den 0201 neu 
konfiguriert wird. 
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Figiir 3 zeigt eine m5gliche achematische Struktur des Debug- 
gings nach Methode Es sei insbesondere beispielhaft auf 
die Figuren 19, 20, 21 der Patentanmeldang DE 199 26 538.0 
verwiesen, in welcher die Grundlage der Speicher beschrieben 
5 ist- Die DE 199 26 538-0 wird hiermit zu Offenbarungszwecken 
vollumfanglich eingegliedert . 

0101b und 0102b ist wie bereits bescshrieben dargestellt. 2u- 
s^tzlich ist eine externer Speichereinheit dargestellt 

10 (0302), der moglicherweise ahnlich DE 199 26 538.0 an 0102b 
angeschlossen (0307) sein kann- Es soil besonders darauf hin- 
gewiesen werden, dafl sowohl 0102b als auch 0302 externe Oder 
interne Speichereinheiten sein kOnnen. Ebenfalls soil eine 
Speichereinheiti als mlndestea ein Register, eine Menge von 

15 Registem oder ein Speicher {RAM^ Flash, o.a.) oder Massen- 
speicher (Festplatte, Band, o.a.) definiert sein. 

Die debuggende Einheit 0301 kann Breakpoints innerhalb 0101b 
setzen (0303), auf Basis derer der eigentliche Debug Vorgang 

20 ausgelSst wird. Durch das Brreichen efimes Breakpoints wird 
eine Information (0304) an 0301 gesendet, die den Debug Vor- 
gang startet; zugleich werden auch alle 0101b interenen Vor- 
kehrungen zum Debuggen (z-B. ein Anhalten und/oder Verlangsa- 
men des Taktes) ausgelSst. Altemativ kann auch durch 0301 

25 die Information generiert und an 0101b gesendet werden. 

(Jber 0305 und/oder 0306 kann 0301 auf die Daten und/oder Zu^ 
stands aus dem Speicher 0102b und/oder dem Speicher 0302 zu- 
greifen. Der Zugrif f kann zum Beispiel 

1. durch eine Speicher kopplung (Block^ove, d.h. kopieren 

30 der Speicher in einen anderen, von 0301 kontrollierten 

Bereich) , 
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2. durch eine Leitung (serielle oder parallele Leitung, 
Ober die ein oder mehrere Speicherbere±ch(e) tibertragen 
wird/werden, z - B • JTAG) , 
3* Buskopplungen gleich welcher Art (die Speicher werden 
5 ahnlich eines DMA-Verfahren arbitrieirt imd von 0301 ver- 

arbeitet) 
erfolgen. 

Als Beispiel wurde eine Figur aus der DB 199 26 538.0 ge- 
10 wShlt, Es soil ausdrucklich darauf hingewiesen werden, dafi 
griindlegend jedes Speicherverfahren und jede Speicherkopplting 
(Stack, Random-Access, FIFO, usw.) entsprechend bearbeitet 
werden kann. . 

15 Die Figuren 4a und 4b zeigen weitere maglichen Ausgestaltun- 
gen iind warden aus der Patentanmeldung DE 102 06 856.9 ent- 
nommen, die zu Of fenbarungszwecken vollumfanglich eingegiie- 
dert ist- 

20 Der Aufbau einer besonders bevorzugteir VPO ist in Figur 4a 
dargestellt. Vorzugsweise hierarchlsche Konfigurationsmanager 
(CT's) (0401) steuem und verwalten eine Anordnung von rekon- 
figurierbaren Elementen (PACs) (0402), Den CT's ist ein loka- 
ler Speicher ftlr die Konf igurationen zugeordnet (0403) . Der 

25 Speicher verfOgt weiterhin fiber ein Interface (04O4) zu einem 
globalen Speicher, der die Konfigurationsdaten zur VerfOgung 
stellt. Ober ein Interface (0405) sind die Konfigurationsab- 
lauft steuerbar. Ein Interface der rekonfigurierbaren Elemen- 
te (0402) zur Ablaufsteuerung und Breignisverwaltung (0406) 

30 i^t vorhanden, ebenso ein Interface zum Datenaustausch 
(0407) • Beipielaweise kann eine der CT's als DB agieren. 



wo 03/023616 



27 



PCT/DE02/0327S 



Pigur 4b zeigt einen Ausschnitt aus einem beispielhaften CPU- 
System^ beispielsweise einem DSP des Types C6000 von Texas 
Instruments (0451). Dargestellt sind Prograraraspeicher (0452), 
Datenspeicher (0453), beliebige Peripherie (0454) und EMIF 

5 (0455) - Ober einen Spelcherbus (0456) und einen Peripheriebus 
(0457) ist eine VPD als Coprozessor integriert (0458). Ein 
DMA-Kontroller (EDMA) (0459) kann beliebige DMA-Transfers ^ 
beispielsweise zwischen Speicher (0453) und VPU (0458) Oder 
Speicher (0453) und Peripherie (0454) dur chf tihren . In diesem 

10 Beispiel kann 0451 als DB arbeiten und insbesondere auch der 
erfindungsgemaBe Debugger mit dessen Debugger gekoppelt 
und/oder in diesen integriert sein. 

Figiir Sa zeigt einen beispielhaften Hardwareaufbau, der zum 
15 Debuggen von rekonfigurierbaren. Prozessoren benutzt werden 
kann. Hierzu wird ein gepipelinter Konfigurationsbus 0501 
verwendet, ahnlicOi dem aus DE 100 28 397.7 bekannten. Die 
Pipeline ist Ober mehrexe Register stuf en (0502) in horizonta- 
ler und/oder vertikaler Richtung aufgebautr um hohere Takt- 
20 frequenzen zu erreictaen. Der gepipelltfte Konfigurationsbus 
ftihrt zu den zu konflgxirierenden Elementen (PABs) (0503), urn 
diese mit Konfigurationsdaten zu versorgen. 

Fignr 5b zeigt beispielhaft die erforderliche Erweiterung ge- 
25 raae der vorliegenden Erfindung. Jede Registerstufe (0502) de- 
krementiert den Zahlenwert (LATVAL) zum Ausgieich der Latenz- 
zeit urn 1 (angedeutet durch -1) • Ebenso dekrementiert jede 
PAE (0503) , die bereits eine Taktsteuerinformation erhalten 
hat, diese pro Takt urn 1 (angedeutet durch -1/T) • Auf die 
30 PABs und insbesondere deren intemen Register kann nunmehr 
nicht nur schreibend, sondem auch lesend zugegriffen werden, 
z.B, Qber eine besondere Steuerleitung (RD), um Debugdaten 
auszulesen. Zu schreibende und gelesene Daten durchlaufen in 
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diesem Beispiel das Bussystem durch das Array aus PAEs von 
links nach rechts and in der untersten Zeil^ in Rtick- 
w^rtsrichtung. Der Konfigurationsbus ist waiter hin tlber Regi- 
sterstufen (0505) pipelineartig zurackgefOhrt (0504). In die- 

5 sem Beispiel kann eine libergeordnete Einheit (CT/Ladelogik, 
Hostprozessor) (0506) ebenso lesend und schreibend auf den 
Bus zugreifen, wie ein dediziertes Testinterface (0507). Das 
Testinterface kann einen eigenen Testkontroller aufweisen und 
insbesondere konqpatibel zu einexa oder mehrem marktgHngigen 

10 Testschnittstellen sein (z.B. JTAG, Tektronix, Rhode&Schwarz, 
etc) . Die Auswahl der bussteuemden Einheit erf olgt Qber eine 
Multiplexer/Demultiplexer-Einheit (0508) . In (0509 in Klam- 
mem und kursiv dargestellt) oder vor den Einhfeiten 0506 und 
0507 kann eine Schaltung zur Rdckxechung der Herkunftsadresse 

15 (0509) von Debugdaten, die tlber 0504 eintreffen^ vorgesehen 
sein. Die Adressberechnungen innerhaXb des aufgezeigten Sy- 
stems geschehen wie folgt: ZtmSchst wird die Adresse durch 

0506 Oder 0507 am Bus 0501 angelegt. Die Adresse wird ahnlich 
der Verarbeitung der Zahlenwerte (LATVAL) zur Latenzberech- 

20 nung in jeder Registerstufe (0502 und -0505) dekranentiert . 
Sobald die Adresse gleich 0 ist, wird die nach der Register- 
stufe liegende PAE selefctiert. In der nachfolgenden Register^ 
stufe wird die Adresse negativ, so daB keine weiteren PAEs 
mehr alctiviert werden. Sofem Daten aus einer PAE gelesen 

25 werden/ werden diese zusammen mit der Adresse zurflckObertra- 
gen. Die Adresse wird dabei in jeder Registerstufe weiter de- 
krementiert. Eine RQckrechnung in 0509 der bei 0506 und/oder 

0507 zusammen mit den Debugdaten eintreffendeq Adressen ist 
nunmehr durch eine einf ache Addition mOglich, indem die An- 

30 zahl der dekrementierenden Registerstufen zu dem eintref fen- 
den Adresswert hinzuaddiert werden. Es soil angemerkt sein, 
dass die Registerstufen 0502 in Figur 5b leicht unterschied- 
lich gegenttber den Registerstufen 0502 in Figur 5a ausgestal- 
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tet sind. In Figur 5b weisen diese namlich zusStzlich eine 
Schaltung (z.B* Multiplexer) zu Auswahl der weiterzuleitenden 
Daten auf, der entweder die Daten des Busses 0501 weiter- 
schaltet oder den Ausgang der zugeordneten PAE (0503) und so- 
5 lait die DebugDaten. Zur Ansteuerung der SchaXtung kann das 
Auftreffen des Adresswertes gleich 0 dienen. 

Es wird nochmals darauf hlngewiesen^ dafi das dedizierte Te- 
stinterface (0507) den Industriestandards entspricht. Es kann 

10 zu Tests wahrend des Software-Debug-Vorgangs eingesetzt wer- 
den und/oder zu 7est vShrend des Zusammenbaus von Hardware- 
kamponenten und -systemen (z^B. dem Zusanimenbau der Schaltun- 
gen auf der Platine) und/oder zu Funktionstests des Halblei- 
terbausteins (Chips) im Rahraen der Halbleiterfertigung. Ins- 

15 besondere dadurch kann die Obliche Scan-Chain zum Test der 
Register w^hrend des Funktionstests des Halbleiters entfallen 
Oder zumindest entsprechend loinijaiert werden, da dann nur die 
Register durch die Scan-Chain geftlhrt werden nUlssenf die 
nicht vda Bussystem (0501) ansteuerbar sind. 

20 

Ebenfalls wird besonders darauf hingewiesen, dafi das in Figur 
5 erlduterte Verfahren keinesfalls auf die Anwendung bei Kon- 
flgurationsbussen beschr&ikt 1st. Gewtthnliche Datenbussystente 
k5nnen ^enso zu den unterschiedlichen vorab auf gezSLhlten 

25 Test-- und Debugglng-Zeitpunkten und -art en verwendet werden. 
Insbesondere sei in diesem Zusamenhang auf das in der DE 197 
04 742.4 beschriebene Datenbussyatem hingewiesen. Die DE 197 
04 742.4 ist hierzu zu Offenbarungszwecken vollumfSLnglich 
eingegliedert. Die in Figur 5 beschriebenen Verfahren kdnnen, 

30 far einen Ingenieur mit gew5hnlichen technischen Kenntnlssen 
leicht nachvollziehbar ebenso auf die DE 197 04 742.4 ange- 
wendet werden. 
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Bin Hischbetrleb unterschiedlicher Bussysteme^ wie Konflgura- 
tionsbussystemen/ Datenbussystezaen nach DB 197 04 742.4 unci 
gewohnlichen Datenbussystenten 1st deswelteren grundsStzllch 
mOgllch. Dazu kOnnen mehrere Testlnterface vorgesehen sein, 
5 Oder wie technisch bevorzugt die Multiple- 
xer/Demultiplexer stufe (0508) auf elne Hehrzahl von Bussyste- 
men (n x 0501, n x 0504} ausgelegt werden. 

Abschllefiend soli noch besonders erwShnt seln, dass durch die 
10 Mckftthrung des Bussystems nach Figur 5b auch die dLn die PAEs 
zu schreibenden Konfigurationsdaten zuruckgeftihrt warden* Un- 
ter Zuhilfenalime der Adressrackrechung (0509) und der zuirtick" 
geffihrten Statusleltung REJ, die nach DB 100 28 397.7, DE 198 
07 B72.2, DB 196 54 593.5-53 elne Zurackweisung der Konflgu- 
15 ratlonsdaten anzeigt, kann auf die Verwendung der Konfigura- 
tionszwischenapeicher-FIFOs nach DE 100 28 397.7 Flguren 8 
und 9 (0805, 0903} verzichtet verden, da deren Funktionalitat 
nuninehr vollumfdnglich tlber das beschriebene Bussystem abge- 
bildet «fird. 
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8, Boarxffsdefiaition 
lofcal zelevanter Zustand 

5 

global relavanter Sfiaataad 

10 

ralevanter Zustand 

15 

irrslevanter Zostand 

20 



Zustand, der nur Innerhalb einer 
bestlzmciten Konfigtiration relevant: 
ist. 

Zustand, der in mehreren Konf igu- 
rationen relevant ist und a:wi- 
schen den Konfigurationen ausge- 
tauscht werden mufi. 

Zustand, der innerhalb einea Al- 
gorithzmis zur korrekten Ausf Oh- 
rung dessen ben<)tigt wird und so- 
mit durch den Algorithnnia be- 
schrieben ist und verwendet wird. 

Zustand, der far den eigentlichen 
Algorithmus ohne Bedeutung ist 
und auch nicht iin Algorithmus be- 
schrieben ist, der jedoch von der 
ausfuhrenden Hardware ln^lemen- 
tierungsabhangig benatigt wird. 
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Titel: Verfahren zum Debuggen rekonfigurierfaarer 

Architekturen 



Patentansprliche 

1. Verfahren zum Debuggen von rekonfigurierfaarer Hardware, 
dadurch gekennzeichnet, daB sSmtliche notwendige Debug- 
information je Konf igurationszyklus in einen Speicher ge- 
schrieben werden, der dann vom Debugger ausgewertet wird. 

2* Verfahren nach dem vorhergehenden Anspruch/ dadurch ge- 
kennzeichnet/ daB wahrend des Debug-Vorganges nach Auf- 
treten einer Debug-Bedingungr gemaB welcher Information 
Qber die zu debuggende Konf iguration benotigt wird/ eine 
Konfiguration geladen wird, mittels welcher die in den 
Speicher geschriebenen Debug-Inf ormationen ausgelesen and 
insbesondere in eine Debug-^Einheit Oder Debug-Konfigura- 
tion geschrieben werden. 

3. Verfahren nach eiriCTi der vorhergehenden AnaprQche, da- 
durch gekennzeichnet, daB eine zu debuggende Konfigurati- 
on vor dem Ablauf des Debugging derart verSndert wird, 
dafi bei normaler, nicht-debuggender Ausftlhrung nicht er- 
forderliche Information in ein«a Speicher abgelegt wird. 

4, Verfahren nach einem der vorhergehenden Aasprtiche, da- 
durch gekennzeichnet, dafi zum Auslesen die Taktfrequenz 
zumindest verlangsamt oder angehalten wird und/oder eine 
taktweise Abarbeitung der zu debuggenden Konfiguration 
Schritt ftlr Schritt erfoigt. 
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5- Verfahren nach elnem der vorhergehenden Anspruche, da- 
durch gekennzeichnetr dafl die zu debuggende Konfiguration 
nach Auslesen der relevanten Information oder nach davor- 
llegender Information simuliert wlrd. 

5 

6. Vorrichtung mit elnem Feld konfigurierbarer Elemente, 
insbesondere grobgranularer logischer und/oder arithmeti- 
scher Einheiten sowie elnem Debug-Mlttel zum Debuggen von 
Programman, Programmteilen oder auf dem Array auszufOh- 

10 renden k^otplexen Operationen, dadurch gekennzelchnet, daft 

das Oebug-Mittel ein Spelchermittel zur Spelchemng von 
fOr das Debugging relevanten Infonoatlonen wUrend oder 
am Snde eines Arbeitsschrittes des Feldes konfigurierba- 
rer Elemente uiofafttr wobei das Speichermittel zum Debug- 

15 ?ing auslesbar ist. 

7. Vorrichtung nach dem vorhergehenden Anspruch, dadurch ge- 
kennzeichnet, daft das Speichermittel als Dual-Ported-RAM 
mit ein^ ersten Eingang ffir abzuspeichemde Information 

20 aus dem Prozessorfeld und elnem zvfeiten Eingang zum Aus- 

lesen der Information in ein Analysemittel ausgebildet 
ist. 
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